mamba架构

Mamba 架构上顶会ICLR 2026，AI大脑核心Transformer的王座还能坐稳吗？

Transformer架构的计算复杂度和序列长度的二次方成正比。你要处理的文本长度增加一倍，计算量就要翻四倍。同时，它的内存占用也随着序列长度线性增长。用它实现AGI，能源和算力需求不可想象。